健康医疗大数据系列文章之一:英国健康医疗大数据平台care.data之殇
今年5月25日,李克强总理在出席贵阳“大数据产业峰会”时,将大数据比作“21世纪的钻石矿、智慧树”。不到一个月,国务院就于6月21日对外发布《关于促进和规范健康医疗大数据应用发展的指导意见》,提出“健康医疗大数据是国家重要的基础性战略资源”;发展健康医疗大数据应用,“将带来健康医疗模式的深刻变化,有利于提高健康医疗服务效率和质量,增加有效供给、满足群众需求,促进培育新业态、形成新的经济增长点”。这份《指导意见》被普遍认为吹响了我国发展健康医疗大数据应用的号角。
确实,将大数据技术应用于健康医疗领域,能带来无限的想象空间。例如在美国,IBM人工智能引擎Watson已经学习了超过60万份医学证据报告、150万份病历和临床实验、2百万页医学期刊研究成果。目前,享誉世界的纪念斯隆—凯特琳癌症中心(Memorial Sloan-Kettering Cancer Center)的肿瘤医生正借助Watson,根据每位病人的症状、基因、病史等量身定制治疗方案。
在英国,今年7月打败围棋高手李世石的谷歌人工智能引擎DeepMind宣布与英国Moorfields眼科医院合作,将对超过100万份的眼部扫描文件进行数据分析和挖掘,创造出能更快、更早地探测出眼部病变的计算机算法。据英国国家医疗服务体系(National Health Service, NHS)统计,98%以上的糖尿病视网膜病变所引起的视力受损,能够通过早期的检测和治疗而避免。
有IBM和谷歌等公司强大的技术实力,再加上丰富的医疗健康大数据作为支撑,不难想象在未来人工智能和大数据技术能做出的巨大贡献。《指导意见》将发展健康医疗大数据应用作为“努力建设人民满意的医疗卫生事业”的关键之一,无疑是找对了抓手,切中了要害。
Care.data大事记
让我们将目光转向英国。在2012年伦敦奥运会开幕式上,英国人将女作家J·K·罗琳与她的哈利·波特,以及提供全民免费医疗的NHS,作为英国最引以为傲的两项代表。显然,英国人不会错过利用大数据技术改善NHS的机会。
早在2011年,时任英国首相卡梅伦就提出,要将NHS累积的医疗健康大数据运用于研究,不仅病患能更快地享受到更有效的治疗,还能进一步巩固英国医疗行业在全世界的领先地位。卡梅伦期待,通过与产业、研究机构共享NHS的医疗健康大数据,NHS能够成为“引领全球医疗创新的典范”。
2013年,英国启动了医疗健康大数据旗舰平台care.data。Care.data集中了最详尽的数据,包括全英国的家庭医生(General Practitioner, GP)和医院记录的病历,以及社会服务信息;数据将用于除“直接医疗”(directcare)之外的目的。NHS期待通过数据资源的统一归口、共享、分析,能够更好地认识病患,研发药物和治疗方式;认识公共卫生和疾病的发展趋势,保障每个人享有高质量的服务;在有限预算中更好地分配医疗资源;监控药物和治疗的安全状况;比较全国各区域的医疗质量。Care.data从诞生之日起就被寄予厚望。
然而就在2016年7月6日,英国NHS却决定从即日起停止care.data计划。如果说将大数据技术运用于医疗健康这个大方向没变的话,那到底NHS在运营care.data的过程中遇到了什么问题?中国在发展医疗健康大数据时,又能从中借鉴什么经验教训?在讨论这些问题前,有必要先回顾下从2013年到现在的三年间,围绕care.data发生的那些事儿。
虽然NHS在2012年提出Care.data计划,但其基本逻辑可以追溯到一个世纪前。1911年,家庭医生的病人医疗记录就被英国政府用于集中统计分析,从纸质记录时代到数字化时代,英国一直致力于对医疗数据的集中化和医疗数据分析挖据,以改善整体医疗水平。2000年,NHS提出了IT计划,拟建设全国集中的医疗保健数据资源库,并允许其数据可被用于科学研究。然而,多年以来,一系列的医疗数据集中化应用的计划并没有取得理想效果,反而引来了众多批评的声音。
2012年英国通过的“医疗和社会保健法案”(Health and Social Care Act)规定,由医疗和社会保健信息中心(Health and Social CareInformation Centre, )代替之前的NHS信息中心,具体负责所有医疗数据的收集、传输、分析和分享。
2013年,NHS委员会正式公开了Care.data项目的具体实施计划:由英格兰NHS指导HSCIS从公立医疗机构和收集医疗数据,并保存在一个国家级数据库。同时,允许NHS和符合条件的私营公司对数据进行研究,并声明研究目的为评估NHS所属医院的安全状况、监控疾病的发展趋势及策划新的医疗服务。
2013年初,在Care.data项目计划发布后,就有一些隐私保护组织发起了“医疗数据保密倡议”(medConfidential),呼吁关注医疗数据使用过程中面临的安全威胁。但NHS并没有表达其与公众进行沟通和咨询的意图,还强调从2013年9月份开始,将正式对集中后的医疗数据进行分析挖掘。
2013年8月,家庭医生收到了的通知,要求其在8周内通知他们的病人Care.data项目需要收集、分析其数据。该举动立即引起了家庭医生的集体反对。原因是按英国1998年颁布的“数据保护法案”(Data Protection Act)的规定,家庭医生是病人隐私数据的控制者。如果在将其控制的病人数据用于“直接医疗”之外的目的时,必须及时通知到病人并征求同意,否则可能会承担法律责任。
NHS提出的要求让家庭医生感到非常为难。有媒体在对400位家庭医生调查后发现,41%的病人选择退出Care.data项目,16%的病人还未做出决定,而且在没有充分时间和资金的情况下,家庭医生很难通知到数量众多的病人。2013年10月,在家庭医生强烈抗议下,NHS表示将投入200万英镑向公众宣传Care.data项目内容。
2014年,care.data依旧麻烦不断。首先,NHS的宣传活动仅是在官网发布视频和向公众派发传单。虽然制作、分发传单的花销高达100万英镑,但后续抽样调查中却发现只有不到三分之一的人表示收到过传单,公开宣传的效果大打折扣。
其次,HSCIC承认其向保险公司出售过病人的数据,面临严厉的数据保护审查。HSCIC的数据披露审计报告显示,医疗数据已经被披露给160个组织,其中包括56家私人企业,虽然HSCIC声明数据已经被匿名化处理,但隐私专家强烈质疑其处理过程的有效性,其披露的数据完全可能被保险公司等组织重新识别为个人数据。
2014年2月,NHS表示,家庭医生可延缓6个月上传病人数据,并首次承认Care.data项目面临严重的信任危机。随后,NHS宣布于2014年秋天选取四个地区开展新的试点,收集265名家庭医生掌握的200万病人的数据,事实上,直至2015年6月,第一个试点才进行开展。
尽管英国政府推出Care.data项目的初衷很好,但其实施过程可谓一波三折、差强人意,“混乱之中的care.data”等字眼也频繁出现在各大媒体报道中。2014年11月,All Party Parliamentary Group)在对Care.data项目进行调查后,指责其过程缺乏透明和公共宣传。2015年1月,NHS的监督机构“独立信息治理监督小组”也发布报告,说明Care.data项目并未完成其承诺,缺少相关专家以致在信息治理方面存在责任。由于执行层面中缺乏对病人隐私保护的足够关注,care.data至始至终没能获得公众的信任。截止今年5月,共有150万人选择退出care.data计划。
总结
总结起来,care.data在实际运作过程中存在三方面的主要问题:首先是管理和沟通方面,在对医疗健康数据集中和统一归口过程中,有关决策和管理人员强行推动计划,却没有充分告知公众,或与各利益相关方沟通。在对隐私保护的担忧日渐发酵时,政府的应对很不及时,也很不充分。
其次是过于依赖技术手段。有关决策和管理人员一遍遍对外强调,收集和共享的数据经过了匿名化或伪匿名化的处理,数据无法回溯到个人,因此不存在隐私泄露的担忧。但实际上,在大数据环境下,数据很可能经过组合、挖掘,重新识别出个人。同时,数据集中存储反而导致遭破坏、窃取、泄露等安全风险的上升,care.data计划的有关决策和管理人员没能向公众提供可信的安全方面的保证。
再次是规则方面的准备不足。Care.data计划没能理顺现有规则方面的冲突。一方面家庭医生具有法律义务保护病人数据的保密性和安全性,另一方面又必须按照要求将数据传输至HSCIC。此外,商业机构能够利用care.data的数据并以此获利?现有的法律没有给出答案。
实际上,医疗数据的应用争议不只是英国特有的情况,比如荷兰和奥地利等其他欧洲国家,在尝试集中化处理医疗数据的时,也存在大量质疑和反对的声音。可以说,care.data这三年波折的历程,我们清晰地看到随着个人越来越重视隐私保护,随着数据保护法律法规的日益完善,关于医疗健康大数据的收集和处理过程是否有效保护了各方权益的争议也会随之增加。
健康医疗大数据既是惠国惠民、驱动新经济的重要举措,也是国家大数据领域应用的试验田和典范,意义重大。我们很欣喜地看到,卫计委副主任金小桃在今年6月17日的新闻发布会中再三强调,“健康医疗大数据的应用发展,最基础的在安全······对于健康医疗大数据的安全和个人健康医疗数据相关的隐私保护,必须予以高度重视,甚至于它决定着我们大数据应用发展的未来”。
但我们也必须承认,健康医疗大数据应用,不只是将已有的数据和安全保护措施转移并集中,而是一个前所未有且极其复杂的过程,涉及法律问题、隐私问题、技术问题、责任问题、信任问题,甚至目前还找不到最佳的实践案例作为参考。因此,要推进好此项工作,迫切需要继续深入剖析国外案例,分析国内现状和存在的问题,研究医疗健康数据的全方位保障体系和保障方案,以预防实施中的各类风险,以避免出现英国类似的情形。
为此,我们将在后续的系列文章中逐一讨论这些方面,为我国医疗健康大数据应用的发展贡献绵薄之力。
注:本文发表于《中国经济周刊》2016年第29期,7月25日出版。